Logo olímpico


1 Introducción


Los Juegos Olímpicos modernos representan uno de los eventos deportivos más influyentes y de mayor relevancia a nivel mundial. Desde su instauración a finales del siglo XIX y su consolidación a partir de 1900, han reunido a millones de atletas provenientes de todo el mundo, quienes compiten en una amplia variedad de disciplinas. A lo largo de las décadas, los Juegos Olímpicos no solo han sido un escenario para la excelencia deportiva, sino también un reflejo de importantes transformaciones sociales, culturales y políticas a nivel global.

2 Descripción del problema


En el contexto de los Juegos Olímpicos, resulta de gran interés comprender qué factores podrían estar asociados con el éxito de los atletas, entendido como la obtención de medallas. Cada disciplina deportiva presenta sus propias particularidades, pero se considera que existen variables generales -como la edad, el género, la nacionalidad o la cantidad de participaciones— que podrían influir en el rendimiento. Explorar estas relaciones permite formular hipótesis y generar una visión más completa del perfil de los atletas exitosos.

Este proyecto tiene como propósito realizar un Análisis Exploratorio de Datos (EDA) para identificar patrones, distribuciones y posibles relaciones entre variables que ayuden a entender qué factores están vinculados al logro de medallas en los Juegos Olímpicos. A través de visualizaciones interactivas, se busca facilitar la interpretación de los datos y descubrir tendencias significativas que permitan una comprensión más profunda del rendimiento olímpico.

Cabe aclarar que los patrones que se observarán en el siguiente análisis representan tendencias generales observadas en el conjunto completo de disciplinas olímpicas, por lo que los factores de éxito pueden variar significativamente según el deporte específico. Este análisis no busca establecer reglas absolutas, sino identificar características comunes asociadas al rendimiento medallista desde una perspectiva exploratoria.

3 Definición de fuente de datos


El análisis se basa en el conjunto de datos llamado “120 years of Olympic history: athletes and results”, el cual está disponible en la plataforma Kaggle. Este dataset contiene información detallada sobre más de 120 años de historia olímpica (1896-2016).

3.1 Variables del dataset


Campo Descripción
ID Número único asignado a cada registro de atleta en los Juegos Olímpicos.
Name Nombre completo del atleta que participó en los Juegos Olímpicos.
Sex Sexo del atleta, representado por “M” para masculino o “F” para femenino.
Age Edad del atleta al momento de participar en los Juegos Olímpicos.
Height Altura del atleta en centímetros.
Weight Peso del atleta en kilogramos.
Team Nombre del equipo del atleta, que corresponde al país o delegación a la que representa.
NOC El código de tres letras del Comité Olímpico Nacional (NOC) del país del atleta.
Games Año y temporada en la que se celebraron los Juegos Olímpicos (por ejemplo, 2008 Summer o 2016 Winter).
Year Año en que se celebraron los Juegos Olímpicos, expresado como un número entero.
Season Temporada de los Juegos Olímpicos: “Summer” (Verano) o “Winter” (Invierno).
City Ciudad en la que se celebraron los Juegos Olímpicos.
Sport Deporte en el que el atleta participó, por ejemplo, Atletismo, Natación, Gimnasia, etc.
Event Evento específico dentro de un deporte, como 100m planos, salto de altura, etc.
Medal Indica si el atleta obtuvo una medalla: “Gold” (Oro), “Silver” (Plata), “Bronze” (Bronce), o “NA” (No aplicable, si no ganó medalla).

Obtenido desde: 120 years of Olympic History Dataset - Kaggle


4 Visualizaciones y análisis


A continuación, se presentará una serie de visualizaciones que exploran distintas variables del conjunto de datos. Cada gráfico irá acompañado de un breve análisis interpretativo que servirá para guiar al lector en la comprensión de los resultados del Análisis Exploratorio de Datos (EDA). Es importante aclarar que cada visualización ha sido seleccionada con el propósito de identificar posibles factores generales que aumenten la probabilidad de éxito de un atleta. Del mismo modo, los análisis serán de carácter general y se profundizará en la relación específica con la problemática planteada en la sección de conclusiones.

4.1 Análisis univariado


En esta sección, exploraremos algunas de las variables más interesantes del conjunto de datos a través de gráficos univariable. Estos gráficos nos permitirán comprender mejor la distribución de los datos en términos de atributos individuales, sin considerar las relaciones entre variables. Los tres gráficos que se presentarán a continuación destacan patrones significativos y tendencias en aspectos clave de los atletas olímpicos.


  1. Frecuencia de participación por deporte.

  2. Distribución de edades de los atletas.

  3. Distribución del peso de los atletas.


4.1.1 Frecuencia de participación por deporte



En la gráfica se puede observar que disciplinas como el atletismo, la gimnasia y la natación destacan notablemente, liderando el número de eventos y atletas participantes. Esto se debe a la variedad de pruebas que componen estas disciplinas (como carreras, saltos, estilos de nado o tipos de gimnasia), así como a su fuerte tradición en los Juegos Olímpicos desde sus inicios.

De manera similar, otros deportes como el ciclismo, la esgrima y el tiro, aunque con menos disciplinas internas, han mantenido una presencia constante a lo largo de numerosas ediciones de los Juegos Olímpicos. Este patrón refleja no solo la popularidad histórica de ciertos deportes, sino también la estructura del programa olímpico, que favorece a disciplinas con múltiples eventos y un acceso amplio para atletas de diversas categorías.


4.1.2 Distribución de edades de los atletas



En el gráfico anterior se visualiza la distribución de edades de los atletas olímpicos. La mayoría de los participantes está entre los 20 y 30 años, lo cual es esperable considerando que muchas disciplinas deportivas exigen un alto rendimiento físico, propio de esta etapa de la vida. También se observan algunas participaciones fuera de ese rango, aunque en menor proporción, lo que sugiere la existencia de deportes donde los atletas pueden competir a edades más tempranas o avanzadas, lo que nos indica que hay deportes olímpicos donde el rendimeinto físico no es lo más importante.


4.1.3 Distribución del peso de los atletas



El gráfico anterior muestra la distribución del peso de los atletas a lo largo de la historia olímpica. La curva presenta un pico pronunciado entre los 60 y 80 kg, lo que indica que una gran parte de los deportistas se concentra en ese rango. Sin embargo, también se observa una dispersión considerable hacia ambos extremos, reflejando la diversidad de requerimientos físicos según la disciplina deportiva. Lo anterior denota que existe una gran diversidad en los deportes y en los requerimientos de cada uno.


4.2 Análisis bivariado


En esta sección, examinaremos relaciones entre pares de variables para descubrir patrones, correlaciones o diferencias relevantes dentro del conjunto de datos. El análisis bivariado nos permite entender cómo se comportan dos variables en conjunto, que clave para identificar tendencias más profundas y contextos específicos.


  1. Número de participaciones vs la obtención de medallas.

  2. Cantidad de medallas ganadas por país.


4.2.1 Participación por sexo a lo largo del tiempo



En el gráfico anterior se analiza la relación entre la experiencia olímpica de los atletas (medida por el número de participaciones) y la probabilidad de haber ganado al menos una medalla. Se observa una tendencia creciente: a mayor número de participaciones, mayor es la proporción de atletas que han conseguido al menos una medalla.

Sin embargo, también es importante considerar que esta relación no implica directamente el éxito, ya que los atletas que logran buenos resultados tienden a ser seleccionados nuevamente, lo que refuerza su presencia en múltiples ediciones. Aun así, el patrón encontrado sugiere que la continuidad y la persistencia en el alto rendimiento pueden ser factores clave al menos de forma general.


4.2.2 Cantidad de medallas ganadas por país


Se pueden ver los 20 Comités Olímpicos Nacionales (NOC) con mayor cantidad de medallas obtenidas a lo largo de la historia de los Juegos. Se nota que hay una marcada concentración de medallas en un pequeño grupo de países, destacando especialmente potencias deportivas como Estados Unidos, Rusia, Alemania o Reino Unido.

Esta concentración refleja no solo el alto rendimiento de estos países en múltiples disciplinas, sino también factores como la inversión en infraestructura deportiva, el desarrollo de programas de alto rendimiento y la participación constante en las ediciones olímpicas.


4.3 Análisis Multidimensional


En esta sección, se integrarán múltiples variables en una única visualización con el propósito de identificar patrones complejos. Esta técnica resulta útil cuando se desea examinar cómo diferentes características interactúan entre sí y cómo influyen de manera simultánea en los resultados, en este caso, la obtención de medallas.


  • Relación entre características físicas y experiencia entre atletas medallistas (general).


4.4 Relación entre características físicas y experiencia entre atletas medallistas



La gráfica presenta una comparación entre 60 atletas seleccionados aleatoriamente del conjunto de datos, divididos equitativamente entre medallistas y no medallistas. Se observa que los atletas que obtuvieron medallas tienden a mostrar características físicas (edad, estatura y peso) levemente más centralizadas, aunque con una alta dispersión general en los valores, probablemente debido a la diversidad de disciplinas y países presentes en la muestra. Además, se evidencia una ligera tendencia a una mayor cantidad de participaciones entre los medallistas, lo que sugiere que la experiencia podría jugar un papel relevante en el logro de resultados.

Si bien las diferencias físicas generales entre ambos grupos no son marcadas, destaca el hecho de que la mayoría de los medallistas pertenecen a países con tradición deportiva sólida y fuerte presencia olímpica. Este contraste refuerza la idea de que, más allá de las cualidades físicas, existen otros factores determinantes en el rendimiento olímpico, como la preparación, el apoyo institucional, la infraestructura deportiva y el contexto competitivo, que pueden influir significativamente en el éxito de un atleta.


4.5 Análisis facético


En esta sección se implementará una gráfica de facetas para un grupo de variables categóricas, en este caso utilizaremos la variable NOC para comparar el desempeño medallista de los atletas de las principales potencias olímpicas mundiales.


  • Comparación mediante facetas: Medallas obtenidas por año.


4.5.1 Comparación mediante facetas: Medallas obtenidas por año.


Este gráfico muestra la evolución del número de medallistas en los Juegos Olímpicos para cinco potencias deportivas (EE.UU., Rusia, China, Reino Unido y Alemania), desglosado por tipo de medalla (oro, plata y bronce). Cada facet corresponde a un país, y dentro de ellos se observa la cantidad total de atletas que obtuvieron medalla en cada edición olímpica. El uso del modo stack por tipo de medalla permite comparar no solo el volumen total de medallistas por año, sino también la distribución entre los diferentes tipos de premios.

Podemos notar que Estados Unidos destaca con una mayor cantidad de medallistas en casi todos los años, especialmente en las medallas de oro, lo cual confirma su dominio histórico en el medallero. Otros países como China y Rusia también muestran picos importantes, aunque con más variabilidad entre años. El gráfico es útil para identificar tendencias en el rendimiento olímpico nacional, como el aumento de medallistas chinos después del año 2000 o el descenso de Alemania. En conjunto, permite observar cómo se reparte el éxito olímpico entre estos países y cómo ha evolucionado con el tiempo.


4.6 Imagen compuestada


A continuación se presentará una imagen compuesta (gráfico de gráficos) en donde se tratan diversas variables categorizadas por el sexo del atleta.


  1. Participación por sexo a lo largo del tiempo.
  2. Distribucion de edades para cada sexo.
  3. Distribución de pesos para atletas de halterofilia.
  4. Distribución de pesos para atletas de gimnasia.


4.6.1 Gráfica compuesta


De la imagen compuesta se pueden analizar diversos patrones derivados de cada uno de los tipos de gráfico que la componen, sin embargo todas analizan un comportamiento de los datos con base al sexo del atleta.


  1. La primera gráfica muestra como ha evolucionado la participación de atletas desde los inicios de estos Juegos. Se puede visualizar cómo la participación de ambos sexos fue creciendo progresivamente, sin embargo, el cambio más abrupto se da en la participación femenina, ya que principalmente a mediados del siglo XX se presenta un alza considerable en su participación, lo que implícitamente denota cambios sociales y culturales propios de la época. Actualmente se ve una participación mucho más equitativa.

  2. Del segundo gráfico se toma una muestra de 500 atletas aleatorios y se puede notar que los atletas masculinos (de manera general) llegan a participar en los juegos a edades más avanzadas y distribuidas a comparación con las mujeres, cuyas edades se agrupan en un intervalo más cerrado.

  3. Para el deporte de halterofilia (tercer gráfico) se esperan atletas algo pesados para ambos generos, esto debido a la fuerza que deben aplicar en su respectiva disciplina, y así se muestra en el gráfico. Para el sexo masculino se nota una distribución de pesos más amplia, aunque la mayoría se concentra entre los 70 y 85 kilogramos, mientras que las mujeres concentran la mayoría de los pesos entre los 70 y 80 kilogramos. La variabilidad de pesos radica en las múltiples modalidades que existe en este deporte.

  4. Para el deporte de la gimnasia (cuarto gráfico) se esperan atletas ágiles y ligeros para ambos sexos, esto debido a la rapidez que necesitan al aplicar sus maniobras, y efectivamente así lo muestra el gráfico distribuyendo los pesos entre los 40 y 60 kilogramos para las mujeres y entre 55 y 80 kilogramos para los hombres


5 Conclusiones


Si bien el éxito de un atleta depende de numerosos factores (incluidos muchos ajenos al ámbito deportivo), el análisis exploratorio del conjunto de datos “120 years of Olympic history: athletes and results” permitió identificar y confirmar patrones que, de forma general, pueden estar relacionados con la obtención de una medalla. Cada visualización aportó no solo información sobre posibles factores de éxito, sino también estadísticas con fuerte carga histórica, social y cultural, lo que convierte a este dataset en una fuente valiosa para múltiples enfoques de análisis.

A través del análisis univariado se identificaron tendencias generales en el conjunto de datos. En primer lugar, se recopilaron los deportes con mayor participación, y se concluyó que su alta densidad poblacional se debe a la existencia de múltiples disciplinas dentro de cada uno. Esto sugiere que un atleta que compite en este tipo de deportes tiene la posibilidad de participar en varias pruebas, aumentando así, de forma estadística, sus probabilidades de éxito. Por otro lado, se analizó de manera general el peso y la edad de los atletas, encontrando que ambos parámetros tienden a concentrarse en intervalos específicos. Esto refleja que el rendimiento físico óptimo suele alcanzarse dentro de ciertos rangos de peso y edad, lo cual sugiere, nuevamente de forma implícita, que estas variables desempeñan un papel importante en el desempeño y éxito de un atleta olímpico.

El análisis bivariado permitió identificar la experiencia como un factor relevante en la probabilidad de que un atleta obtenga una medalla. Se observó que, a mayor número de participaciones en los Juegos Olímpicos, mayor es la posibilidad de alcanzar el podio. Asimismo, se evidenció que los países con mayor número de medallas suelen ser las principales potencias mundiales, lo que sugiere que uno de los factores más determinantes en el éxito olímpico es la infraestructura deportiva, así como los recursos y el apoyo brindado por el comité olímpico nacional de cada país.

Gracias al análisis multidimensional (mediante una muestra del dataset) se pudieron ver de manera muy general, las relaciones entre peso, altura, edad y cantidad de participaciones diferenciando por color a los atletas que ganaron y no ganaron una medalla. Si bien no se observó un patrón determinante entre los ganadores y no ganadores (probablemente debido a lo general de los datos), se logró reafirmar la idea de que las NOC (comités nacionales) y la experiencia son factores de éxito muy generales.

El análisis facético permitió un examen más detallado de la distribución de medallas en cada una de las potencias deportivas seleccionadas, revelando no solo el volumen total de medallistas a lo largo del tiempo, sino también cómo se han comportado individualmente en distintas ediciones olímpicas. Este enfoque puntual facilitó la identificación de patrones únicos en cada país y reforzó la idea de que el éxito olímpico responde a procesos históricos, estratégicos y estructurales propios de cada nación.

La imagen compuesta permitió identificar patrones generales en torno a la participación y características físicas de los atletas olímpicos, diferenciando por sexo. Se observó un aumento progresivo en la participación femenina a lo largo del tiempo, reflejo de cambios sociales y culturales. En cuanto a la edad, los hombres tienden a competir en rangos más amplios, mientras que las mujeres se agrupan en intervalos más definidos. El análisis por deporte confirma que disciplinas como la halterofilia presentan atletas con mayor peso, mientras que en gimnasia predominan cuerpos más ligeros, en ambos casos con diferencias por sexo que responden a las exigencias de cada actividad. En conjunto, la imagen evidenció cómo el sexo del atleta influye en distintas variables relacionadas con el rendimiento, participación y preparación dentro del contexto olímpico.

En conjunto, este análisis exploratorio permitió comprender con mayor profundidad las múltiples dimensiones que rodean el desempeño olímpico. Aunque ningún factor por sí solo garantiza el éxito, variables como el sexo, la edad, el peso, la experiencia y el país de origen del atleta muestran una influencia significativa en los resultados. Además, el estudio deja en evidencia la riqueza histórica y social del dataset, lo que lo convierte en una herramienta valiosa no solo para el análisis deportivo, sino también para investigaciones con enfoques culturales, sociológicos y de desarrollo deportivo a nivel global.